概率论之 您所在的位置:网站首页 高斯分布 1sigma 概率论之

概率论之

2023-03-16 06:35| 来源: 网络整理| 查看: 265

概率论之——高斯分布的乘积一、前言二、高斯分布(正态分布)标准高斯分布高斯分布的基本性质三、高斯分布的乘积python示意图四、多维高斯分布五、共轭分布后记

一、前言

本来我并不想开机器学习这个专栏,因为机器学习与高数线代矩阵论概率论密切相关,我的数学能力没达到这种高度。然而控制理论也会涉及各种数理统计知识,那就不得不开一个数理栏了。

这个栏没有具体的知识路线,写到哪算哪,数学和机器学习相关且不好分类的东西都会往这边放。

二、高斯分布(正态分布)

假设随机变量x1x_1x1​服从均值和方差为μ1,σ12\mu_1, \ \sigma_1^2μ1​, σ12​的高斯分布,可记作x1∼N(μ1,σ1)x_1 \sim N(\mu_1, \ \sigma_1)x1​∼N(μ1​, σ1​),其概率密度函数为: p(x1)=12πσ1exp⁡[−(x−μ1)22σ12]p(x_1)= \frac {1} {\sqrt {2\pi}\sigma_1} \exp [ - \frac {(x-\mu_1)^2}{2\sigma_1^2}] p(x1​)=2π​σ1​1​exp[−2σ12​(x−μ1​)2​]

标准高斯分布

如果随机变量x∼N(0,1)x \sim N(0, 1)x∼N(0,1),则称xxx服从标准高斯(正态)分布: p(x)=12πexp⁡(−x22)p(x)=\frac {1}{\sqrt {2\pi}} \exp ( - \frac {x^2}{2}) p(x)=2π​1​exp(−2x2​)

高斯分布的基本性质

假设x∼N(μ,σ2)x\sim N(\mu, \sigma^2)x∼N(μ,σ2),有: ax+b∼N(aμ+b,a2μ2),a,b∈Rax+b \sim N(a\mu+b,a^2\mu^2)\ ,a,b\in Rax+b∼N(aμ+b,a2μ2) ,a,b∈R 假设x∼N(μx,σx2)x\sim N(\mu_x, \sigma_x^2)x∼N(μx​,σx2​),y∼N(μy,σy2)y\sim N(\mu_y, \sigma_y^2)y∼N(μy​,σy2​),x,yx,yx,y是独立随机变量,有: x+y∼N(μx+μy,σx2+σy2)x+y\sim N(\mu_x+\mu_y,\sigma_x^2+\sigma_y^2) x+y∼N(μx​+μy​,σx2​+σy2​)

三、高斯分布的乘积

进入正题。假设两个独立随机变量x∼N(μx,σx2)x\sim N(\mu_x, \sigma_x^2)x∼N(μx​,σx2​),y∼N(μy,σy2)y\sim N(\mu_y, \sigma_y^2)y∼N(μy​,σy2​),则它们的乘积符合高斯概率密度函数的形式: (x,y)∼N(μyσx2+μxσy2σx2+σy2,11/σx2+1/σy2)(x,y)\sim N(\frac {\mu_y\sigma_x^2+\mu_x\sigma_y^2} {\sigma_x^2+\sigma_y^2},\frac{1} {1/\sigma_x^2+1/\sigma_y^2}) (x,y)∼N(σx2​+σy2​μy​σx2​+μx​σy2​​,1/σx2​+1/σy2​1​) 具体的推导方式,可以通过p(x)p(y)p(x)p(y)p(x)p(y)乘积获得: p(x)p(y)=12π2σxσyexp⁡(−σy2(x−μx)2+σx2(x−μy)22σx2σy2)p(x)p(y)=\frac {1} {2\pi^2\sigma_x\sigma_y} \exp (-\frac {\sigma_y^2(x-\mu_x)^2 + \sigma_x^2(x-\mu_y)^2} {2\sigma_x^2\sigma_y^2}) p(x)p(y)=2π2σx​σy​1​exp(−2σx2​σy2​σy2​(x−μx​)2+σx2​(x−μy​)2​) 通过将expexpexp中的(σx2+σy2)x2(\sigma_x^2+\sigma_y^2)x^2(σx2​+σy2​)x2和常数项凑平方后,能够得到一个形似λ12πσexp⁡[−(x−μ)22σ2]\ \lambda \frac {1} {\sqrt {2\pi}\sigma} \exp [ - \frac {(x-\mu)^2}{2\sigma^2}] λ2π​σ1​exp[−2σ2(x−μ)2​],只不过系数λ\lambdaλ的存在使得这个函数的积分不等于1。

具体的证明可以参照这个Blog:

两个高斯分布乘积的理论推导 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/chaosir1991/article/details/106910668/

python示意图

在这里插入图片描述 红色函数是蓝绿两个高斯分布的乘积结果,可以看出其形状也是对称的,但与x轴围成的面积少于另外两个高斯分布。

四、多维高斯分布

如果X=[x1,x2,…,xn]TX=[x_1,x_2,\dots,x_n]^TX=[x1​,x2​,…,xn​]T是个服从高斯分布的多维随机变量,可以记为X∼N(μ,Σ)X\sim N(\mu, \Sigma)X∼N(μ,Σ),其中μ=[μ1,μ2,…,μn]T\mu=[\mu_1,\mu_2,\dots,\mu_n]^Tμ=[μ1​,μ2​,…,μn​]T,Σ∈Rn×n\Sigma \in \R^{n\times n}Σ∈Rn×n是各分量的协方差矩阵。

概率密度函数可表示为: p(X)=1(2π)n/2∣Σ∣1/2exp⁡(−(X−μ)TΣ−1(X−μ)2)p(X)=\frac {1}{(2\pi)^{n/2}|\Sigma|^{1/2}}\exp (-\frac {(X-\mu)^T\Sigma^{-1}(X-\mu)}{2}) p(X)=(2π)n/2∣Σ∣1/21​exp(−2(X−μ)TΣ−1(X−μ)​)

多维高斯分布有一个比较重要的性质: 对于多维高斯分布X∈RnX\in \R^nX∈Rn,经过线性变换A∈Rk×nA\in \R^{k\times n}A∈Rk×n,Y=AX∈RkY=AX\in \R^kY=AX∈Rk仍然是一个多维高斯分布,且Y∼N(Aμ,AΣAT)Y\sim N(A\mu,A\Sigma A^T)Y∼N(Aμ,AΣAT)

此外,两个多维高斯分布概率密度函数的乘积,仍然具有多维高斯分布概率密度函数的形式。

五、共轭分布

贝叶斯定理有: p(x∣z)=p(z∣x)p(x)p(z)∝p(z∣x)p(x)p(x)ispriorp(x∣z)isposteriorp(z∣x)islikelihoodp(x|z)=\frac {p(z|x)p(x)}{p(z)} \propto p(z|x)p(x) \\ p(x)\ is \ prior \\ p(x|z)\ is \ posterior \\ p(z|x)\ is \ likelihood p(x∣z)=p(z)p(z∣x)p(x)​∝p(z∣x)p(x)p(x) is priorp(x∣z) is posteriorp(z∣x) is likelihood

如果后验分布和先验分布是同类型的分布,则称先验分布和后验分布是共轭分布,先验分布是似然的共轭先验。

根据高斯分布的特性,如果先验和似然都是高斯分布的形式,那么它们是共轭的。

后记

在这里记录一个二维正态分布的充要条件:

(x,y)(x, y)(x,y)服从二维正态分布,当且仅当xxx和yyy的任意线性组合均服从一维正态分布。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有